Can AI Match Human Experts? Evaluating LLM-Generated Feedback on Resident Scholarly Projects
Este estudo demonstra que um modelo de linguagem aberto (LLaMA-3.1) pode gerar feedback formativo em projetos de residentes de Medicina Familiar com qualidade comparável à de especialistas humanos, superando-os em certas avaliações de segurança e em contextos específicos, embora o feedback humano permaneça superior no geral.